Coding Agent:是一种专门用于编程任务的智能体,它能够在软件开发过程中根据环境中的工具,执行相应的操作,去辅助用户做一些功能,如代码生成、调试、优化等。 如何用好AI编码Agent呢? 让Agent理解当前仓库和业务背景 初始化Memory: 让Agent通读当前代码仓库,并创建WIKI, 通过Human In The Loop维护文档。 使用Plan模式:让Agent自查完成任务时的上下文匮乏,多轮提问Human In The Loop补充。 使用Act模式:让Agent跳过询问,根据自己的理解直接执行。 还有一些其他技巧比如:时间管理技巧:在吃饭前、在开会前和买菜前把任务交给AI Agent,之后检查。
代码生成管道是 Coding Agent 的核心输出模块。 执行反馈是 Coding Agent 从"生成代码"到"完成任务"的关键环节。 调度编排层是 Coding Agent 的"大脑",负责全局状态管理和任务协调。 coding_agent.execution.execution_engine import ExecutionEngine from coding_agent.execution.feedback_loop Agent 使用""" # 创建 Agent agent = await create_coding_agent() # 创建用户请求 request
虽说它们都是某次Coding工作过程的一部分,但未必都值得留在主上下文里。 接下来还有另一个问题:Agent该如何行动,行动权又该如何分配。可能会有人觉得多Agent系统是一群Agent合理分工,同时工作:这个写前端,那个写后端,还有一个改测试,最后一起合并。 判断权与写入权Cognition的实践告诉我们,目前更可行的多Agent结构是让多个Agent围绕一条主写入路径提供支持,而不是让一群Agent自由行动。 而多Agent系统今天最有效的方式,是写入保持单线程,额外的Agent贡献智能,避免到处行动。这句话背后的工程含义很重要。多Agent可以扩大判断来源,但写入权要控制好。 否则,系统会从“多个Agent协作”变成“多个Agent各自带着不同上下文修改同一个系统”。ReviewAgent与干净上下文代码审查是一个典型的多Agent分工场景。
但如果你想继续往下压,就要开始处理系统层的问题:命令输出怎么压、检索怎么少走弯路、多个 Agent 怎么把上下文拆开。 第六章 多 Agent 协作:边界清晰时,CodeBuddy 会更省 Token 前两层解决的是“单个上下文怎么更省”。这一层继续往前走:别让所有任务都挤进同一个上下文。 换句话说,前面讲的是“单个会话怎么省”,这里讲的是:多个 Agent 怎么分工协作,才能在任务边界清晰时更省。 6.2 subagent:任务隔离的最低成本方式 CodeBuddy 的 Skill 里可以直接调用 Agent tool,把子任务分发出去: 使用 Agent tool 分析这个 PR 的影响范围, 前提是子任务真的能拆开;如果每个 Agent 都要重复读同一批背景,拆得越多,反而越贵。
摘要: 本文给出一条用 TokenHub + OpenClaw + Hy Token Plan 搭建 Coding Agent 的接入路径,覆盖模型选型、API Key 申请、Base URL 配置、套餐抵扣与并发管理 一、为什么 Coding Agent 这条赛道值得重做 过去两年,AI 编程工具从单纯的"代码补全"演化到"任务级 Agent"——给一句需求,工具自己能拆解、写代码、跑测试、改 bug。 这一步的 100 万 Tokens 足够你跑通一个 Coding Agent 的 PoC,先不用着急买套餐。 四、典型 Coding Agent 工作流的资源消耗 下表给出一个体感参考(不是承诺值,仅用于估算套餐档位): 任务类型 上下文输入量级 多轮迭代 推荐起步套餐 单文件代码补全 数千 Token 较少 六、写在最后 把一个 Coding Agent 真正跑稳定,比写一个 Demo 难得多——它是模型能力、Agent 框架、成本控制三件事的合体工程。
这意味着,Coding Agent 正在从“被调用的功能”,变成“可运行、可观察、可恢复、可管理的执行单元”。 AI Coding 的核心界面,可能不再只是编辑器里的聊天框,而会逐渐变成一个 Agent 执行控制台。 过去我们谈 AI Coding,很容易把注意力放在模型上。 这些变化各自看,都是产品更新;但放在一起看,它们指向的是同一个方向:Coding Agent 正在拥有自己的运行时。 图 1|从功能入口到执行单元 过去,Agent 更像是某个入口里的能力。 当这些东西逐渐组合起来,Coding Agent 就不再只是一个写代码的助手,而开始成为一种新的研发执行单元。 这时候,企业要关注的问题也会变。 Coding Agent 正在拥有自己的运行时。
Edit模式:等同cursor的manual模式,这里会修改代码,需要用户确认 Chat模式:等同cursor的Ask模式,可以任意对话 那 JetBrains AI assistant 的agent去哪里了
我们正在从“氛围编程”(Vibe Coding)进入“智能体工程”(Agentic Engineering)的新时代。 从氛围编程到智能体工程:从业余到专业的进化 去年,Andrej 创造了“氛围编程”(Vibe Coding)这个词。 Andrej 认为,Vibe Coding 的核心价值在于“提高所有人的下限”。 但这只是故事的一半。 当你把 Vibe Coding 的产物放到专业的、严肃的生产环境中时,问题就来了:它可能引入漏洞,可能存在性能隐患,可能设计得一塌糊涂。 参考来源:Andrej Karpathy: From Vibe Coding to Agentic Engineering
科技要闻 • Nvidia 发布 Vera CPU,专为 AI 智能体工作负载打造:N 家这次把"为 Agent 加速"写到了 Slogan 里,意味着 Coding Agent 这种"长上下文 + 这事儿让我开始认真思考一个问题:在一个有大量历史包袱的真实项目上,怎么把 Coding Agent 跑成"团队的人",而不是"外包来的临时工"? 第四刀:让 Agent "做饭",不让它"端菜" 这一刀比较反直觉,我也是最近才想明白。 很多团队用 Coding Agent 的姿势是:Agent 写代码 → 人提交 → 人沟通 → 人合并。 2) Agent 的 "记忆"是负担,不是资产 这点和现在很多"长期记忆"产品的方向反着来,但我跑下来的真实感受就是:Coding Agent 的长上下文记忆,往往是污染源。 写在最后:工具是放大器 三个月跑下来我最大的感受是:Coding Agent 不是"另一个工程师",它是团队规范的放大器。
Agentic Coding 换了一种方式——你是技术负责人,你手底下有一个团队: 你给 Tech Lead 说:"实现一个订单模块,明天交付" Tech Lead(Orchestrator Agent 这就是 Agentic Coding 的核心:从"人 ↔ AI"到 "人 → 多 Agent 团队 → 结果"。 Agent 1(编码)→ Agent 2(审查)→ Agent 3(修复) 练习 1:双 Agent 代码审查 这是最简单的 Agentic 实验,你不需要搭建任何系统: 打开你的 AI Coding 五、如何行动 不需要装任何新软件,只需要你手头的 AI Coding 工具: 天 练习 时间 学到什么 Day 1 双 Agent 审查:写代码 → 让 AI 审查 → 修复 20min 顺序链模式 Day 六、一个重要的诚实声明 Agentic Coding 的工具有很多(CrewAI、LangGraph、AutoGen、各 AI Coding 工具的内置 Agent 模式),但这些工具的底层原理都一样—
实例 • 自动冲突感知:Agent A 修改了 Agent B 已读文件,B 立即收到通知 • Agent 可自主 fork 子 Agent 团队(主 Agent → 协调者,子 Agent → 执行者 1 │ └── Agent 2 │ └── 工作树管理器 (WTM) ├── Agent 3 └── Agent 4 角色 核心权限 协调者 唯一可生成/关闭 Agent Agent 协商 关键约束:Agent 不能链式生成。 冲突时 Agent 自行协商 Agent A 要改 Agent B 已读的文件 → File Touch Notification(冲突感知) → Agent A 和 B 通过 DM 自行协商 Agent、审批 Plan 更新、处理失败重试/替换 恢复机制(Agent 挂了怎么办): 操作 含义 retry 同一 Agent 重试 reassign 转给另一个现有 Agent replace
注意:此计划基于需求“请基于playwright登录默认租户的管理后台(管理员账号密码从初始数据获取),然后对考生管理进行增删改查的验证。整个过程需要基于playwright进行录屏。”生成。
Agent 改变的是专业开发者的工作流,那么 Vibe Coding 平台正在做的是更激进的事情:把「拥有一个软件」这件事的门槛拉到普通人也能触达。 二、当前 Vibe Coding 平台的工程难题:LLM 写代码已经不是瓶颈 Vibe Coding 平台表面是 AI 产品,底层其实是 Agent Runtime、云沙箱、应用后端、多租户隔离和按量计费的组合工程 从产品形态看,Vibe Coding 平台只是「自然语言进、应用出」的一个黑盒: 自然语言 → Vibe Coding 平台 → 应用 但从工程视角看,它是几种复杂系统的叠加体: Agent Loop 对 Vibe Coding 平台来说,更现实的路径是站在一套成熟的云基础设施之上,把精力集中在 Agent 编排和产品体验上。 /agent-runtime 3.2、让 Agent 生成的应用真正可用 Vibe Coding 产物不应该只停留在静态页面,而要自然获得数据库、身份认证、云存储、云函数、静态托管、容器托管和 HTTPS
欢迎交流和关注~ 最近一个越来越明显的感受是,前沿 AI Coding 的讨论,正在慢慢从“Agent 会不会做”,转向“系统能不能支撑 Agent 稳定做完”。 前一阶段,大家更关心的还是 Agent 本身:会不会拆任务,能不能把需求一路推进到可提交状态,出码率高不高。 这些当然仍然重要,因为它们决定了 Agent 是否真的进入了研发流程。 这意味着,前沿 AI Coding 的差距,正在不只是体现在模型会不会生成代码。 当然,这并不意味着 Agent 能力已经不重要了。 收敛一点说: 前沿 AI Coding 的下一阶段,拼的可能已经不只是 Agent 能做多少, 而是谁先把围绕任务表达、执行推进与结果验证的系统能力,组织成一个可持续运行的整体。
变成一个命令在本地运行 Coding Agent 比较有意思的是,他这里面提到了三个工具,每一个我都有介绍: llmfit:电脑能跑多大模型,一键测算+本地部署 llama.cpp:内网部署llama.cpp Pi:与 Claude Code、OpenCode 有完全不同设计哲学的 Agent 工具——pi 而 HF-agent 把他们完美揉合——模型、推理服务、Agent 串起来了 安装很简单 curl - system # 显示硬件 hf agents fit search "qwen" # 搜索模型 hf agents fit recommend --use-case coding hf agents fit recommend --use-case coding --min-fit good -n 5 --json 当前这台机器,比较靠前的推荐包括: bigcode/starcoder2 检测完毕就可以一键启动 Pi 了:hf agents run pi 十分建议大家尝试一下 Pi 这个 Coding Agent 如果不想本地模型驱动,你也可以试试Ollama ,原生命令增加了对 Pi
了解当前大模型解决复杂问题上到底遇到了什么问题 了解内部智能化产品和工具存在的意义是什么,相比起外部第三方产品有哪些优势 预告:将于 10 月 23 - 25 召开的 QCon 上海站设计了「Vibe Coding 」专题,想要深入了解从应用到产品到工程和算法,基于 AI 实现 Vibe Coding 效率倍增的实践案例,对这一领域最前沿的发展能有一个快速完整的理解,并在自己的业务场景中实现的同学不要错过。 我们来对比一下两个 Agent 产品,如下表所示: 5 建设 Agent 遇到的挑战 在通用 Agent 的发展过程中,我们遇到了一些挑战和问题。 当主 Agent 指示子 Agent 进行系统测试时,如果之前生成的用户名和密码没有传递给子 Agent,子 Agent 可能会不断尝试不同的用户名和密码来登录,而不是询问主 Agent 获取正确的凭据 例如,当我们指示 Agent 生成一个 HTML 邮件时,如果明确指出不要使用转义符,但 Agent 仍然坚决使用转义符,或者当我们要求 Agent 按照五子棋规则进行测试时,Agent 却逐个尝试无效的黑白棋步
今天我们就来分享 3 个有用的开源项目,专门帮你的 Coding Agent 整理“上下文”:让它少翻无关代码,少吞冗长日志,把 token 留给更关键的信息。 Agent 需要理解某个功能时,可以先查这张图,知道相关代码大概在哪里、谁调用了谁、哪些文件可能有关。这样一来,Coding Agent 不用一上来就把很多文件都塞进上下文。 它适合的 Coding 场景也很清楚:当项目比较大、文件比较多、调用关系比较绕时,CodeGraph 能大大减少 grep 和 read 的相关操作。 读取日志和 diff 的 token 消耗"],}Coding Agent 写代码时,会经常性执行像是git diff、npm test、cargo test、docker ps、pytest、go 它可以让 Claude Code 和其他支持 MCP 的 AI Coding Agent,直接从整个代码库里搜索相关代码,减少多轮 grep 和 read。
Agent 改变的是专业开发者的工作流,那么 Vibe Coding 平台正在做的是更激进的事情:把「拥有一个软件」这件事的门槛拉到普通人也能触达。 02 当前 Vibe Coding 平台的工程难题:LLM 写代码已经不是瓶颈 Vibe Coding 平台表面是 AI 产品,底层其实是 Agent Runtime、云沙箱、应用后端、多租户隔离和按量计费的组合工程 从产品形态看,Vibe Coding 平台只是「自然语言进、应用出」的一个黑盒: 自然语言 → Vibe Coding 平台 → 应用 但从工程视角看,它是几种复杂系统的叠加体: Agent Loop 对 Vibe Coding 平台来说,更现实的路径是站在一套成熟的云基础设施之上,把精力集中在 Agent 编排和产品体验上。 详细设计见 Agent 运行:Brain / Hands 分离与受控信任边界: https://docs.cloudbase.net/solutions/vibe-coding-platform/agent-runtime
打字时你脑子里的“默认信息”,agent是完全拿不到的。语音虽然更啰嗦,但信息密度反而更高。这是个小点,但非常实用。需求不清?让它来“采访”你这是我觉得最有价值的一点。 一个判断标准写规则前问自己一句:这件事,agent能靠常识推断出来吗?能→不写不能→才写否则文件会越来越臃肿。Skills和AGENTS.md,本质完全不同这个我卡了很久才想明白。 让agent写agent的流程,比你自己写更省事2.不要过早封装只有当一个任务开始反复出现,才值得做成Skill。否则只是制造维护成本。 问题:agent直接改你当前文件→改错→状态混乱→回滚麻烦解决方案:用GitWorktrees给agent单独一个目录:出问题→直接删不影响主工作区任务越大,这个习惯越重要。 3.不要让agent改活跃文件(GitWorktrees,前面说过)几个实用命令我自己常用的:/fork:开新分支探索/resume:恢复任务/agent:切换agent/status:查看状态/compact
根据腾讯对该产品的介绍,该产品本身是对标行业一流 CLI 产品,打造专业工程师用的专业 CLI Agent工具。 实现我前面谈到的类似Vibe Coding氛围编程的体验。 CodeBuddy CLI Agent本身内置多种工具,支持文件编辑、命令运行与提交创建,并能通过 MCP 灵活扩展 或 自定义开发工具。 基于Vibe Coding思路的AI辅助编程 接着,我们再来测试下Vibe Coding能力。注意我前面专门解释过Vibe Coding,简单来说就是基本不接触或主动去修改代码的编程。 我在前面也谈到过,一个是缩短整个上下文长度,一个是我们现在是AI软件工程,是基于Spec Coding的思路来辅助开发,而不是完全的Vibe Coding。